Modelos de equações estruturais

Aula 6 — Partial Least Squares SEM (PLS-SEM)

Estatístico — CONRE 1ª Região Nº 11477

Princípios estruturais

TEORIA QUALITATIVA!

O que a teoria indica que forma gestão de documentos? O que a teoria indica que forma gestão de conhecimento?

Ex: Se o estudo fosse sobre “Governança”, a teoria indica que este é um construto complexo, em que a literatura indica como a governança sendo formada por “Disclousure”, “Compliance”, “Fairness” e “Accountability”.

OBSERVAÇÕES: Sobre o projeto específico: Se o cliente tivesse boa certeza da teoria qualitativa, o CB-SEM seria a melhor alternativa, como estávamos fazendo.

PLS-SEM é especialmente útil quando não temos uma teoria qualitativa robusta, mas temos DADOS (poucos, pode ser), e queremos testar algumas hipóteses simples.

Neste sentido, o cliente está explorando o PIOR dos dois mundos: CB confirmaria a teoria com dados sintéticos. PLS criaria alguma teoria com poucos dados.

PLS com dados sintéticos irá explorar caminhos não confirmatórios sobre dados que não existem.

CB-SEM vs PLS-SEM

CB-SEM

  • “Confirmatória”

  • Orientado à reprodução da matriz de covariâncias

  • NÃO usa componentes principais: Fatores comuns. (Variância comum entre manifestas e latentes).

PLS-SEM

  • “Exploratória”

  • Orientado à maximização da variância explicada (R²)

  • Abordagem de variável composta:

Combinações lineares iterativas dos indicadores para maximizar a variância explicada (não é ACP, mas compartilha a lógica de variáveis compostas).

  • Lida melhor com construtos formativos.

Pressupostos

  • Variável composta \(\neq\) traço latente.

  • Tamanho amostral: “pequeno”, em geral.

  • Distribuição dos dados não precisa ser normal. Porém, utilizaremos bootstrap para validação e IC dos parâmetros. Distribuições com divergências graves de assimetria e curtose em relação à Normal, podem influenciar negativamente o procedimento.

  • Linearidade.

  • Dados pelo menos ordinais (Policóricos não são obrigatórios em PLS, diferente de CB)

(Nominal < Ordinal < Discreta < Contínua)

  • Relações unidirecionais e recursividade:

OU A impacta B, OU B impacta A.

OBS: Todo construto deve ter papel teórico no modelo.

(Variáveis exógenas puras não recebem setas, mas podem existir construtos apenas explicativos)

Cuidados

  • Valores influentes (OBS:Não será um problema para nós);

  • Endogeneidade: Correlação entre variáveis exógenas com termo de erro: Se as variáveis exógenas estão associadas à termo de erro, indica omissão de variável, que não está no modelo.

  • Heterogeneidade: Pressupõe grupos HOMOGÊNEOS. Caso existam clusters (características sociodemográficas), devem ser indicados.

  • Efeitos não lineares.

Fonte: “Structoral model robustness checks in PLS-SEM”. Sarstedt, M. Ringle, C. M., Chea, J., Ting, H. Moisescu, O., & Radomir, L. (2019). Tourism Economics, 26(4), 531-554.

O modelo estrutural

  • Variáveis endógenas: “Recebem setas” de outras latentes/compostas;

  • Variáveis exógenas: NÃO “recebem setas” de outras latentes/compostas;

Formativo vs Reflexivo

  • Construtos formativos NÃO aceitam bem correlações fortes entre as manifestas que formam o construto -> Regressão MULTIPLA.

  • Reflexivo: EXIGE alta correlação para as manifestas -> Regressão MULTIVARIADA.

Identificar causalidade: Quem causa quem?

Como identificar: Teoria Qualitativa: A análise quantitativa NÃO é capaz de identificar.

Regra de bolso: Se as manifestas VÃO ser feitas ainda, é REFLEXIVO. Se as manifestas JÁ ocorreram (passado), é FORMATIVO.

Exemplo Formativo vs Reflexivo — Satisfação

Reflexivo

  • Esta empresa parece boa
  • Eu recomendaria esta empresa
  • Irei investir nesta empresa
  • Qual a chance da empresa ser X nos próximos 3 meses?

Note: Estas manifestas REFLETEM a satisfação. Coisas que VÃO ser feitas ainda.

Formativo

  • Fui bem atendido
  • Os funcionários são bons
  • A loja estava limpa
  • Com qual frequência a empresa apresentou comportamento X nos últimos 3 meses?

Note: Estas manifestas FORMARAM a satisfação. Estas coisas ACONTECERAM.

FONTE: Wilcox, J. B., Howell, R. D., & Breivik, E. (2008). “Questions about formative measurement”. Journal of Business Research, 61(12), 1219–1228. https://doi.org/10.1016/j.jbusres.2008.01.010

Algoritmo PLS

Existem três implementações principais dos esquemas de ponderação:

  • Modelo de centroide

  • Modelo fatorial

  • Modelo de caminho

A literatura frequentemente recomenda o modelo de caminho quando não existem construtos formativos. Quando existem estes, o modelo fatorial é frequentemente recomendado.

Utilizar o algoritmo no plspm no R

A função principal do pacote é a plspm(), que funcionará de maneira análoga à um lm() para ajuste, com os seguintes argumentos principais:

  • Dados;

  • Diagrama de caminho: Matriz booleana triangular inferior;

  • Blocos: Relação de variáveis manifestas por variável latente;

  • Indicar se a relação é reflexiva ou formativa;

  • Esquema de ponderação (centroide, fatorial, caminho);

  • Padronização de variáveis MANIFESTAS;

  • Tolerância para convergência;

  • Máximo de iterações;

  • Bootstrap.

Avaliação do modelo — Confiabilidade de construtos reflexivos

OBS: APENAS para REFLEXIVOS.

Confiabilidade INTERNA (unidimensionalidade):

  • Alfa de Cronbach (C.alpha) -> 0.5/0.6/0.7 < alfa < 0.9/0.95;

  • Medida de confiabilidade composta [MCC] (DG.rho) -> 0.7 < alfa < 0.9;

  • Autovalor (eig.1st,eig.2nd)

OBS: Medem precisão, mas não medem acurácia.

Regras de bolso:

  • Alfa de Cronbach como limite inferior, MCC como limite superior.

  • Para as duas primeiras, especialmente alfa: Valores > 0.95 indica redundância semântica.

  • 1º Autovalor >1 E “significativamente superior” ao 2º autovalor.

Fontes:

  • “A primer on Partial Least Squares Structural Equation Modeling (PLS-SEM)”. Hair et al.

  • “PLS Path Modeling with R”. Gaston Sanchez.

Avaliação do modelo — Validade convergente

  • Cargas (loadings); -> Correlação entre a variável manifesta e a variável latente.

  • Indicador associado ao ITEM

Regra de bolso: Carga > 0,708 (quadrado > 0,5) -> Carga em valores ideais.

  • Comunalidade (do item); -> Quanto da variação do item é explicada pelo construto.

  • Indicador associado ao ITEM

  • Regra de bolso: Comunalidade > 0,5 (afinal, é o quadrado do loading).

  • Média da variância extraída (AVE) -> Soma dos quadrados das cargas / n

  • Indicador associado ao CONSTRUTO

  • Regra de bolso: AVE >= 0.5 -> Média da comunalidade do item.

Avaliação do modelo — Validade discriminante

Verifica se os itens estão apontando para as latentes corretas.

  • Cargas cruzadas (cross-loading)

Critério: Carga entre variável manifesta e variável latente a qual pertence seja superior do que em outras variáveis latentes (medida discriminante)

  • Critério de Fornell-Larcker

Critério: Calcula a raiz quadrada da AVE, e comparar com a correlação do construto em relação aos outros (Desejável: Raiz quadrada da AVE > correlação)

  • Heterotrait-Monotrait Ratio (HTMT)

Critério: Ponto de corte: Observar IC, se não passar pelo 1, indica Validade discriminante. Valores pontuais < 0.85 / 0.90 são frequentemente usados como referência.

Avaliação do modelo — Construtos formativos

  • Validade convergente

Análise de redundância. Critério: Reflexivo > .7, então “deve servir para formativo”. (um pouco duvidoso este critério)

  • Colinearidade

Fator de inflação de variância (VIF). Critério: < 5

  • Significância e relevância dos indicadores

Pesos (weights) -> Avaliar significância e relevância.

Avaliação do modelo estrutural

  • Colinearidade (VIF)

. < 5 -> Sem problemas de colinearidade.

Verificar se há colinearidade dos construtos EXÓGENOS em relação aos ENDÓGENOS.

OBS: Aparentemente, NÃO será uma questão neste projeto, visto que não existem múltiplas exógenas apontando para endógena(s): há apenas 1 endógena e 1 exógena!

  • Significância e relevância dos coeficientes de caminho

Setas entre os modelos estruturais

Verificar significância estatística E relevância (tamanho do peso)

OBS: Caso concreto: GD -> GC, apenas.

  • Efeitos diretos e indiretos

Efeito total: Efeito direto + efeito indireto.

OBS: Não teremos, aparentemente, avaliação de efeitos indiretos neste projeto, visto que não há latentes compostas (latente1 -> latente2 -> latente3 => avaliar efeito de l1 em l3).

  • Coeficiente de determinação (R²) e Coeficiente de determinação ajustado (adj. R²)

R²: Interpretação análoga à regressão múltipla:

Quanto da variação da variável latente exógena explica a variação da variável latente endógena.

Regra de bolso (relativa): <.15: Baixo; .15 < R² < .6: Médio. >.6: Alto.

adj. R²: Interpretação análoga à regressão múltipla

Idem ao R², mas mais robusto para comparação de modelos.

  • Tamanho do efeito (f²)

Contribuição do construto exógeno para um construto endógeno. contribuição de variável dependente em contexto de regressão. (não vai fazer muito sentido neste projeto, pela mesma questão do efeito indireto).

  • Relevância preditiva (Q²) e tamanho do efeito (q²)

Q²: Se > 0, indica que o construto exógeno têm relevância preditiva para construto endógeno. (Apenas faz sentido para REFLEXIVAS).

q²: Se existe relevância preditiva, então o quanto uma variável contribuiu para a outra.

  • Média da redundância

O quanto que a variação das variáveis manifestas da variável exógena explica a variação das variáveis manifestas da variável endógena.

  • Pseudo GoF.

Problemático quando existem construtos formativos. Se existem apenas construtos reflexivos, não existem tantos problemas. 0 a 1 -> Explicação da qualidade do modelo de mensuração e estrutural, conjuntamente. Medida geral.

Regra de bolso (Tenenhaus et al., 2005): Baixo: GoF <= 0.1 Médio: GoF =~ 0.25 Bom: GoF => 0.36

Validação do modelo

  • Bootstrapping;

  • Convergência.

Antes de rodar o modelo

  • O modelo faz sentido teoricamente?

  • As direções das setas são justificáveis?

  • Os construtos são reflexivos ou formativos?

  • O objetivo é explicação ou predição?

Implementação

Vamos ao R

O que PLS-SEM NÃO faz

  • Não prova causalidade

  • Não substitui teoria

  • Não valida modelos mal especificados

  • Não corrige dados ruins

Referências

  • Canal Youtube - Prof. Adonai Lacruz. Série “PLS-PM no R”. Videos 1 a 5.

  • PLS-SEM or CB-SEM: update guidelines on which method to use”. Hair Jr, Matthews, Matthews, & Sarstedt, M. (2017)

  • “Structoral model robustness checks in PLS-SEM”. Sarstedt, M. Ringle, C. M., Chea, J., Ting, H. Moisescu, O., & Radomir, L. (2019). Tourism Economics, 26(4), 531-554.

  • Wilcox, J. B., Howell, R. D., & Breivik, E. (2008). “Questions about formative measurement”. Journal of Business Research, 61(12), 1219–1228. https://doi.org/10.1016/j.jbusres.2008.01.010

  • “A primer on Partial Least Squares Structural Equation Modeling (PLS-SEM)”. Hair et al.

  • “PLS Path Modeling with R”. Gaston Sanchez.

Por hoje é só!

Dúvidas?

Feedbacks?